DE eng

Search in the Catalogues and Directories

Page: 1 2
Hits 1 – 20 of 24

1
『日本語歴史コーパス』統合語彙表(バージョン2022.03)
BASE
Show details
2
『日本語歴史コーパス』短単位統合語彙表(バージョン2021.03)
BASE
Show details
3
コーパスで日本語の歴史を探る : 「通時コーパス」プロジェクトの取り組み
In: https://www2.ninjal.ac.jp/openhouse/2019/ (2021)
BASE
Show details
4
コーパスを使った日本語の歴史の研究
In: https://www2.ninjal.ac.jp/openhouse/2018/ (2021)
BASE
Show details
5
『日本語歴史コーパス』の紹介
In: https://www2.ninjal.ac.jp/openhouse/2020/ (2021)
BASE
Show details
6
多重の読みを持つ宣命コーパスの構築
In: http://id.nii.ac.jp/1001/00208605/ (2020)
BASE
Show details
7
近代の歴史的資料を対象とした機械学習による文境界推定
In: http://id.nii.ac.jp/1001/00203040/ (2020)
Abstract: 首都大学東京 ; 首都大学東京 ; 国立国語研究所 ; 首都大学東京 ; Tokyo Metropolitan University ; Tokyo Metropolitan University ; The National Institute for Japanese Language and Linguistics ; Tokyo Metropolitan University ; 本稿では,機械学習を用いて近代の歴史的資料に対して文境界を検出する手法を提案する.近代の歴史的資料は明確な文境界が必ずしも存在しないため,これまで人手作業による文境界の付与が行われてきたが,膨大な資料に対してなかなか作業が進んでいない現状がある.そこで我々は機械学習を用いて文境界を検出する手法を提案する.この手法により膨大な量の資料に対して文境界の一次的なアノテーションを施すことができることに加えて,形態素解析の精度を向上させたことが本研究の貢献である.また,モデルの訓練に日本語の近代語のデータを使用して,複数の機械学習手法を比較して近代の歴史的資料を対象とした文境界推定を行うのは本研究が初めてである. ; In this study, we propose a method to detect sentence boundaries for modern Japanese texts using machine learning. For modern Japanese texts, sentence boundaries are not explicitly marked so that human annotation is inevitable, but the annotation process is far from complete due to enormous number of materials. Therefore, we propose a method to detect sentence boundaries using machine learning. The main contribution of this study is that this method can support the annotation task as a primary annotation. We also show that the accuracy of morphological analysis can be improved by performing sentence boundary detection. Moreover, this is the first work to detect sentence boundaries targeting modern Japanese texts by using modern Japanese data for model training and comparing multiple machine learning methods.
Keyword: [特集:人文科学とコンピュータ] 近代文語; UniDic; 文境界推定; 近代語コーパス
URL: http://id.nii.ac.jp/1328/00003056/
https://repository.ninjal.ac.jp/?action=repository_uri&item_id=3072
BASE
Hide details
8
「人情本コーパス」の設計と構築
藤本 灯; 北﨑 勇帆; 市村 太郎. - : 国立国語研究所, 2017
BASE
Show details
9
多重の読みを持つテキストのコーパス化
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details
10
『日本語歴史コーパス』における原文KWIC表示機能の実装
In: http://pj.ninjal.ac.jp/corpus_center/lrw2017.html (2017)
BASE
Show details
11
日本語コーパスの包括的検索環境の実現に向けて
In: http://pj.ninjal.ac.jp/corpus_center/lrw2016.html (2017)
BASE
Show details
12
〈著書紹介〉 近藤泰弘,田中牧郎,小木曽智信 編 『コーパスと日本語史研究』
小木曽 智信. - : 国立国語研究所, 2016
BASE
Show details
13
『現代日本語書き言葉均衡コーパス』の文境界修正
小西 光; 中村 壮範; 田中 弥生. - : 国立国語研究所, 2015
BASE
Show details
14
パネル・ディスカッション
清水 康行; 小林 千草; 田中 牧郎. - : 国立国語研究所, 2014
BASE
Show details
15
〈共同研究プロジェクト紹介〉萌芽・発掘型 : 統計と機械学習による日本語史研究 歴史的日本語資料のアノテーションと自動濁点付与
小木曽 智信; Toshinobu OGISO. - : 国立国語研究所, 2013
BASE
Show details
16
中古和文における個人文体とジャンル文体 : 多変量解析による歴史的資料の文体研究
小林 雄一郎; 小木曽 智信; Yuichiro KOBAYASHI. - : 国立国語研究所, 2013
BASE
Show details
17
〈受賞紹介〉 中古和文を対象とした形態素解析辞書の開発
小木曽 智信. - : 国立国語研究所, 2012
BASE
Show details
18
〈全文〉 近代語コーパス設計のための文献言語研究 成果報告書
田中 牧郎; 岡島 昭浩; 小木曽 智信. - : 国立国語研究所, 2012
BASE
Show details
19
近代語テキストの形態素解析
小木曽 智信; Toshinobu OGISO. - : 国立国語研究所, 2012
BASE
Show details
20
『現代日本語書き言葉均衡コーパス』形態論情報データベースの設計と実装 改訂版
小木曽 智信; 中村 壮範. - : 国立国語研究所, 2011
BASE
Show details

Page: 1 2

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
24
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern